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The invention relates to a method and device for electronic archiving of a data flow (2) which contains graphic and/or text information 
and is outputted by a computer (2). The print data flow (5) is converted from a printer-specific data format into a pixel based data format 
(Bit map). Form data (8) is distinguished from variable data (9) in said pixel based data and both categories of data (8,9) are processed 
differently. 
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(57) Zusammenfassung 

Die Erfindung betrifft ein Verfahren und cin Gerdt zur elektronischen Archivierung des von einem Computer (2) abgegebenen 
Datenstroms (5), der grafische und/oder Textinformationen enthalt. Der Druckdatenstrom (5) wird von einem druckerspezifischen 
Datenformat in ein auf Pixel basierendes Datenformat (Bit Map) umgesetzt. Bei den auf Pixel basierenden Daten werden Formular— Daten 
(8) von variablen Daten (9) unterschieden und diese beiden Datenarten (8 t 9) jeweils unterschiedlich verarbeitet. 
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Verfahren und Gerat zur elektronischen Archivierung eines 
Computer-Datenstroms 

5 Die Erfindung betrifft ein Verfahren und eiri Gerat zur 
elektronischen Archivierung des von einem Computer 
abgegebenen Datenstroms nach dem Oberbegriff des 
Patentanspruchs 1. 

10 Ein solches Verfahren und ein solches Gerat sind aus der DE- 
4408327 Al bekannt. In Computern erzeugte Dokumente, die 
sowohl grafische als auch numerische und alphanumerische 
Inf ormationen enthalten, werden dabei iiber eine 
Schnittstelle, beispielsweise eine Standard- 

15 Druckerschnittstelle, an ein Archivierungssystem ubertragen. 
Innerhalb des Archivierungssystems werden die zu den 
Dokumenten gehorenden Daten auf Massenspeichern wie 
Magnetbandern, magnetischen oder optischen Speicherplatten 
Oder dergleichen langfristig auf bewahrt . Diese Art der 

20 Speicherung ersetzt in zunehmendem Mafie altere 

Verf ahrensweisen, bei denen auf Papier vorliegende Dokumente 
bzw. Originale mit einem optischen Abtaster (Scanner) erfafit, 
das so erhaltene Bild in elektrische Signale umgewandelt 
wurden und dann in Archiven abgelegt wurden. Die fruher 

25 tibliche Microverf ilmung von Dokumenten wird durch diese neue 
Technik in zunehmendem MaBe ersetzt, wenn die Originale 
bereits in Form von elektronischen Signalen bzw. Computer- 
Da tens trGmen vorliegen. 

30 Elektronische Archivierungssysteme der eingangs genannten Art 
setzen einen vom Computer ausgegebenen Datenstrom in der 
Regel in einen Datenstrom mit spezif ischem /: an das Archiv 
angepaflten Datenformat urn. In vielen Anwendungsf alien ist der 
Datenstrom des Computers an bestimmte Ausgabesysteme, 

35 insbesondere an Drucker, angepafit. Beispiele solcher 
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Druckdatenstrome sind das von IBM gepr&gte Format IPDS oder 
das von Hewlett Packard gepragte Datenformat PCL. 

Ein Archivierungssystem setzt diese Datenstrome auf ein 
Format um, welches dem Archivierungssystem entspricht. Die 
direkte Speicherung der vom Computersystem abgegebenen Daten 
erweist sich dabei als sehr nachteilig, weil dabei eine sehr 
grofie Anzahl an Systemparametern, z.B. Zeichenf onts, mit 
abgespeichert werden mufite. Auch die Reproduktion derart 
abgespeicherter Daten wiirde sich dann als sehr aufwendig 
erweisen. Archivierungssysteme speichern die Daten deshalb 
auf einer Pixel-orientierten Basis, z.B. im sog. TIF-Format, 
ab. Durch eine derartige, punktweise aufgebaute 
Speicherungstechnik eroffnet sich dann die M5glichkeit, das 
15 Datenvolumen nach gangigen Komprimierungsverf ahren zu 

verringern. Das Datenvolumen derart komprimierter Daten ist 
um sogrofier, je mehr. schwarz-weifS Obergange zu verarbeiten 
sind. Andererseits werden Druckseiten in zunehmendem Mafie 
optisch immer aufwendiger gestaltet. Beispielsweise werden 
auf Formularen immer haufiger Grauraster hinterlegt, um diese 
optisch ansprechender zu gestalten und Hervorhebungen besser 
kenntlich zu machen. Diese Entwicklung hat zur Folge, daii bei 
der Archivierung Druckseiten einen immer groiieren 
Speicherbedarf haben. 



20 



25 



30 



In einem anderen, bekannten System, dem sog. COLD-System, 
werden Daten zur Archivierung getrennt als uberwiegend 
grafische Daten und als Uberwiegend kodierte Daten 
(Zeilendaten) abgelegt. Bei erweiterten COLD-Verf ahren werden 
Rohdaten und Ressourcen ebenfalls getrennt abgelegt und bei 
der Reproduktion wird der gesamte Druckprozess nachgebildet . 
Dies bedingt eine komplexe Resourcen-Verwaltung. 



35 



Aus der DE 195 15 981 Al ist ein Verfahren zum Erfassen 
manuell beschriebener Belege bekannt, bei dem die Belege 
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gescannt und anschlie&end unter Ausblendung von 
Vordruckinformationen an Bildschirmen weiterbearbeitet 
werden. Da die Vordruckinformationen bei der 
Weiterverarbeitung nicht mehr verftigbar sind, eignet sich 
5 dieses Verfahren nur dann, wenn die auf der Vorlage 
abgedruckten Informationen zum Zeitpunkt der 
Weiterverarbeitung noch bekannt bzw. verfiigbar ist. Fur ein 
langf ristiges Archivierungssystem 1st dieses Verfahren 
deshalb kaum geeignet. 

10 

In der Verof f entlichung Wong, K.Y. et . al., ^Document 
Analysis System", in IBM J. Res. Develop., Vol. 26, No. 6, 
Nov. 1982, Seiten 647-656 ist ein Verfahren zur 
Unterscheidung zwischen Textdaten und graphischen Daten - 
15 beschrieberi. Es eignet sich zum manuellen Bearbeiten von* 
gescannten Dokumenten, ist aber -fur die -Archivierung von 
Druckdaten nicht ohne weiteres einsetzbar. 

Aufgabe der Erfindung ist es, ein System zur Archivierung von 
20 Computer-Datenstr6men bereit zu stellen, bei dem ein hoher 
Datenkompressionsgrad erzielt werden kann, auch wenn 
aufwendige grafische Informationen archiviert werden sollen. 

Diese Aufgabe wird durch die im Patentanspruch 1 und im 
25 Patentanspruch 15 beschriebene Erfindung gelost. Vorteilhafte ' 
AusfUhrungsformen der Erfindung sind Gegenstand der 
Unteranspriiche . 

Die Erfindung beruht auf der Erkenntnis, dafi ein Groiiteil der 
30 zu archivierenden Computer-Datenstrdme, insbesondere an 
Drucker. zugefiihrte Datenstrome, aus zweierlei Datenarten 
besteht. Einerseits sind in diesen Druckdaten haufig 
Formulare hinterlegt, die far eine bestimmte Anzahl 
zusammengehoriger Druckdatensatze, sog. Jobs, in ein und 
35 derselben Weise wiederkehren . Andererseits sind ' diese 
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Formulare mit variablen Daten gefttllt, welche jeweils das 
Charakteristische eines Dokuments darstellen. Erf indungsgemaii 
wurde erkannt, daii der durch Formulare hervorgerufene Anteil 
an. komprimiertem Druck-Datenstrom oft denjenigen Anteil 
5 uberwiegt, der durch die variablen Daten hervorgeruf en wird. 
Erf indungsgemafi werden deshalb diejenigen Daten, die von 
Formularen stammen, von denjenigen Daten, die variabel sind, 
getrennt, und die beiden Datenarten jeweils getrennt auf Bit- 
Map-Basis, insbesondere komprimiert, weiterverarbeitet . 

10 Innerhalb des Archivierungssystems werden diese Daten 

voneinander getrennt abgespeichert und spater zum Betrachten 
wieder zusammengefuhrt ; dies kann insbesondere Pixel-genau 
erfolgen. Fur eine Gruppe zusammengehorender Daten (Job) 
werden die Daten eines Formulars nur einmal abgelegt. Bei den 

15 einzelnen Dokumenten werden die zugehorigen variablen Daten 
mit dem Formular nur noch in der Weise verkniipft, daft ein 
Verweis auf den entsprechenden Speicherbereich des Formulars 
abgelegt wird. Vorteilhaft ist dabei, daft sich die - in der 
Regel umf angreiche Datenmenge eines Formulars - fur jeden Job 

20 auf ein einmaliges Abspeichern des Formulars beschrankt. 
Hierdurch wird eine betrachtliche Speicherplatzeinsparung 
gegenuber Systemen des Standes der Technik erzielt. 

Bei Druckgut mit hoher Auflage, d.h. mit haufig 
25 wiederkehrenden, gleichartigen Formularen, wird hierdurch ein 
hoher Grad an Speicherplatzeinsparung erreicht. 

Vorteilhaft ist weiter, - insbesondere gegenuber dem o.g. 
COLD-Systemen - daft sich die Reproduktion der Daten sehr 
30 einfach gestaltet, weil auf Bit-Map-Basis (z.B. TIF-Format) 
nur ein Viewer zur Reproduktion benotigt wird 
(selbsttragendes Format) . 

Als vorteilhaft erweist es sich auch, zusammen mit den 
35 Verweisen eine Information abzuspeichern, die ein genaues 
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Zusammenfuhren der Formulardaten mit den zugehorigen, 
variablen Daten erm5glicht . 

In einer weiteren, vorteilhaf ten Ausf uhrungsf orm der 
5 Erfindung werden die Formular-Daten je Job, d.h. je 

zusammenhangendem Datenstrom, nur einmal im Archivspeicher 
als Bit Map abgespeichert, wahrend die variablen Daten jedes 
Dokuments des Jobs jeweils einzeln abgespeichert werden; 

10 In einer aufext rem hohen Komprimierungsgrad ausgerichteten 

Ausf uhrungsf orm werden die Formulardaten inhaltlich reduziert 
Oder sogar ganzlich unterdruckt. In einem derartigen System 
wurden dann im Archivspeicher nur noch die variablen Daten 
abgespeichert. :. 

15 

Eine Unterscheidung zwischen Tormulardaten und variablen 
Daten erfolgt vorzugsweise im druckerspezif ischen 
Datenformat, d.h. bevor der Druckdatenstrom bzw. die 
betroffenen Teile davon in das pixelbasierte Datenformat 

20 umgesetzt werden. Dabei ist es insbesondere gunstig, 

Formularindikatoren zur Erkennung von Formular-Daten zu 
verwenden wie beispielsweise die in IPDS-Druckdatenstromen 
ublichen Overlay-Daten Oder in PCL-Druckdatenstromen Makros, 
formularspezif ische Grafiken wie grau hinterlegte Rechtecke 

25 oder dergleichen. Dabei mufi nicht zwangslaufig ein gesamtes, 
einer Seite entsprechendes Formular gesucht und gefunden 
werden. Erf indungsgemaft kann bereits durch das Erkennen 
einzelner- Formularbestandteile ein hoher Grad an 
Speicherplatzeinsparung erzielt werden. Auf jeder Seite 

30 konnen mehrere Bestandteile auftreten. 

Werden Formularindikatoren verwendet , so kann eine hohe 
Performance beim Archivieren erreicht werden, weil 
Formulardaten bzw. , -strukturen relativ einfach bzw. 
35 eindeutig erkennbar sind. Dabei kann es vorteilhaft sein, 
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Formularindikatoren relativ restriktiv einzusetzen, wobei 
Formulardaten nur dann als solche bezeichnet werden, wenn mit 
relativ einfachen Beurteilungskriterien sicher ist, dafi die 
entsprechenden auf Pixelbasis umgesetzten Daten pixelgenau 
5 iibereinstimmen. Zur Perf omancesteigerung wahrend des 

Archivierungsprozesses kann auch beitragen, wenn fur die zu 
erkennenden Formulardaten eine Mindestgrofte vorgesehen ist. 
Sehr kleine Bildelemente in einem Druckdatenstrom werden dann 
nicht der Prozedur zur separaten Rasterung und einer 
10 Zwischenspeicherung zugefiihrt sondern gemeinsam mit den 
variablen Daten gerastert und gespeichert. 

Bei der Suche der Daten in dem Archivspeicher bzw. bei der 
Rekonstruktion des ursprunglichen Datenstroms konnen die -- 
15 Formulardaten mit den Inhaltsdaten entweder automatisch 
uberlagert werden anhand von Steuerungssignalen (Fig. 1, 
Verweis) oder aber variable Daten und Formulardaten getrennt 
voneinander geladen und vom Bediener gesteuert iiber,einander 
gelegt werden. 

20 

Im Zuge des Archivierens konnen neben den variablen Daten und 
den Formulardaten sog. Index-Daten erzeugt werden, in denen 
Suchkriterien abgespeichert werden, sowie die Verweisdaten 
auf die Speicherorte der variablen Daten und gegebenenf alls 
25 der Formulardaten. 

In einer weiteren, vorteilhaf ten Ausf iihrungsf orm der 
Erfindung erfolgt der Datenubertrag zum Computersystem in das 
Archivsystem Ober einen Drucker-Controller, welcher mit einem 

30 nachgeschalteten Computer zusammenarbeitet . Der Druck- 
Cpntroller kann dabei also sowohl zum Erzeugen eines 
Pixeldatenstroms zur Ansteuerung eines Druckers, als auch zum 
Erzeugen eines Archiv-Datenstroms verwendet werden. Die 
beiden Datenstromverbindungen konnen insbesondere zeitlich 

35 parallel erfolgen, wodurch eine hohe Geschwindigkeit des 
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Gesamtprozesses (Drucken und Archivieren) erreichbar ist. Vom 
Controller zum Computer erfolgt der Datentransfer; sowohl fur 
die Formular- und, variablen Daten des punktorientierten 
Datenformats (Bit Map) als auch die im zeichenorientierten 
5 (ASCII-Format) Indexdaten liber eine gemeinsame Schnittstelle . 

Die Verkniipfung, d.h. der Verweis von den variablen Daten zu 
den Formular daten, kann innerhalb des variablen Datensatzes 
hinterlegt werden, innerhalb des entsprechenden Index- 
10 Datensatzes oder in beiden Datensatzen. . 

Weitere Vorteile und Wirkungen der Erfindung werden anhand 
der nachfolgend beschriebenen Ausf iihrungsbeispiele deutlich, ■ 
die im Zusammenhang mit zwei Figuren beschrieben werden.- — 
15 

Es zeigen: — 

Figur 1: ein elektronisches Archivierungssystem, 

20 Figur 2: elektronische Komponenten des Archivierungssystems, 

Figur 3: einen Ablauf -.zum Erkennen und Trennen der 
verschiedenen Datentypen in einem Druckdatenstrom/ 

25 Figur 4: einen Ablauf zum Archivieren von getrerint 
abgespeicherten Daten und 

Figur 5: einen Ablauf zum Drucken eines vorab getrennten 
Druckdatenstroms . 

30 

Bei dem in Figur 1 dargestellten elektronischen 
Archivierungssystem wird der von einem Host-Computer 2 
abgegebene Datenstrom uber eine Archivierungs-Schnittstelle 1 
an einen Archiv-Speicher 3 abgegeben. Der Archiv-Speicher 3 
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kann insbesondere ein Gerat zum Beschreiben von Laser- 
Speicherplatten sein. Die im Archivspeicher 3 gespeicherten 
Daten konnen in dem Bit-Map-basierten Datenf ormat mit einem 
Lesegerat (Viewer) 4 abgeruf en und beispielsweise wiederum 
5 auf einem Computerbi Ids chirm dargestellt werden . 

Der vom Host-Computer abgegebene Datenstrom 2 wird uber eine 
Standard-Druckerschnittstelle in einen Controller 6 
(ISTREAM) eingespielt . Diese Daten sind in Form sog. Jobs — 

10 gruppiert. Ein Job ist ein zusammenhangender Datenstrom, der 
in irgendeiner Weise (logisch oder physikalisch) miteinander 
verknupft ist. Innerhalb des Host-Computers kann 
beispielsweise eine Marke von auften zugefiihrt werden, die 
bestimmte Druck-Datenstrome miteinander zu einem Job 

15 verbindet. 

Innerhalb der Archivierungs-Schnittstelle werden die vom 
Host-Computer gelieferten Daten 5 klassif iziert nach 
variablen Daten 9 und Formular-Daten 8. Die Formular-Daten 
20 (z.B. Overlays) stellen dabei _ einen fixen Anteil des Jobs 
dar, der auf mehreren Druckseiten des Jobs unverandert 
auftritt. Die variablen Daten sind dagegen innerhalb eines 
Jobs von Druckseite zu Druckseite unterschiedlich. 

25 In der Archivierungs-Schnittstelle werden nunmehr far jeden 

Job die Formulardaten 8 fur jedes Formular nur jeweils einmal 
hinterlegt, wahrend die variablen Daten seitenweise 
hinterlegt werden, Gleichzeitig werden Index-Daten erzeugt, 
die zu den variablen Daten bestimmte Zusatzinf ormation 

30 enthalten, beispielsweise herausgegrif f ene Ordnungsnummern, 

Namen, Stichworte oder dergleichen. Die Index-Daten werden im 
Zuge der weiteren Verarbeitung in Form einer Datenbank 
weiterverarbeitet und ermoglichen dem spateren Benutzer des 
Archivs, bestimmte Datensatze wiederzuf inden. Die Index-Daten 

35 enthalten far alle variablen Datensatze Verweis-Inf ormationen 
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11, welche die Zuordnung bzw. das Wiederfinden der variablen 
Daten 9 ermoglichen. 

Um alle variablen Daten einer Druckseite auch mit dem 
5 zugrundeliegenden Formular-Datensatz 8 zu verbinden, muli ein 
Verweis zwischen variablen Daten und Formular erfolgen. 
Dieser kann entweder direkt als Verweis 12 oder indirekt iiber 
den Index-Datensatz 10 als indirekter. Verweis 13 erfolgen. 
Zur Sicherheit konnen auch alle drei Verweisarten 11, 12 und 
10 13 gemeinsam fur jede Druckseite hinterlegt werden.. Die so . 
erzeugte Datenstruktur 7 wird dann iiber eine geeignete 
Verbindung dem Archiv-Speicher 3 zugefiihrt. 

Die Formular-Daten 8 und die variablen Daten 9 sind - genauso 
15 wie die Archiv-Daten - innerhalb einer Bit Map-Datendomane 
14, wahrend die Index-Daten in einem kodierten Format, z.B. 
ASCII vorliegen. 

Figur 2 zeigt eine Ausf iihrungsf orm fur eine erf indungsgemafie 
20 Archivierungs-Schnittstelle 1. Sie ist unterteilt in einen 

Drucker-Controller 6 und einen nachgeschalteten Computer .15, 
welcher beispielsweise ein Personal Computer (PC) sein kann. 

Die vom Host-Computer 2 gelieferten Daten werden iiber einen 
25 Kanalanschluli 16 eingespeist. Von diesem werden sie in einem 
Zwischenspeicher 17 zwischengespeichert . Aus diesem Speicher 
werden die Daten sukzessive von einer Rastersteuerung .18 . 
entnommen, die die Druckdaten in ein Bit Map Muster umsetzt. 
Die Rastersteuerung 18 verfugt hierzu iiber einen nicht naher 
30 gezeigten Speicher, welcher Rasterinf ormationen zur Umsetzung 
der Druckdatensprache in die entsprechenden Bit Map 
Inf ormationen enthalt. Die Rastersteuerung 18 unterscheidet 
innerhalb eines zusammengehdrenden Druckjobs Formulardaten 
von variablen Daten. Gleichzeitig produziert sie zu jedem Job 
35 einen Index-Datensatz, welcher zur Verwaltung der. zu - 
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archivierenden Daten dient. Die Rasters teuerung 18 speichert 
die variablen Daten in einem variablen Datenspeicher 19, die 
Formulardaten in einem Formu la r datenspeicher 20 und die 
Index-Daten in einem Index-Datenspeicher 21 ab. Diese drei 
Speicher 19, 20 und 21 sind Bestandteil des flOchtigen 
Arbeits-Bildspeichers 22, des Controllers 6. Die in den 
Datenspeicher 19, 20 und 21 erzeugten Daten werden dann aber 
eine gemeinsame Schnittstelle 23 an den nachgeschaltenen 
Personal Computer 15 ubertragen. Den Datentransf er steuert 
eine Gesamtsteuerung 24 des Controllers 6, welche mit einer 
Bedienoberflache und Steuerung 25 des Personal Computers 15 
verbunden ist. 

Die Rastersteuerung 18 behandelt Formular-Daten und variable 
Daten unterschiedlich. Fur Formulardaten werden eigene Bit 
Maps im Formularspeicher erzeugt. Fur die variablen Daten 
werden im Speicher 19 Bit Maps erzeugt, die keine Formular- 
Daten (Overlays) enthalten. 

Die Index-Daten, welche im Index-Speicher 21 abgelegt werden, 
enthalten Verwaltungsinf ormationen, welche u.a. fur jede 
Seite des Druckjobs die verwendeten Formula r-Over lays ablegt. 
Dabei wird auch der Bezug zwischen variablen Daten und 
Formular-Daten hergestellt. 

Innerhalb des Personal Computers 15 werden die aus dem 
Speicher far variable Daten 19 und dem Speicher far 
Formulardaten 20 stammenden Daten in einer 

Komprimierungsstufe 26 komprimiert . Die Index-Daten werden 
vorzugsweise ohne Kompression in einer Index-Warteschlange 27 
zwischengespeichert, bis sowohl variable als auch 
Formulardaten die Komprimierung durchlaufen haben. Im 
Anschlufi an die Komprimierungsstufe 26 sind zwei parallel 
geschaltete Warteschlangen 28, 29 fur die variablen Daten und 
far die Formular-Daten vorgesehen, in denen die 
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entsprechenden Daten so lange zwischengespeichert werden, bis 
die zugehorigen iibrigen Daten die Komprimi e rungs stufe 
ebenfalls durchlaufen haben. 

5 Die in den, Warteschlangen 27 , 28 und 2 9 befindlichen Daten 
werden dann von einer Synchronisierungsstuf e 30 gemeinsam 
entnommen und liber eine Net zwerksteuerung 31 zur 
Ausgabeschnittstelle 32 in Richtung zum Archivspeicher 3 
abgegeben. 

10 

In einer weiteren vorteilhaf ten Ausf uhrungsf orm konnen alle 
Verarbeitungseinheiten des Personal-Computers 15 auch in dem 
Drucker-Controller integriert sein. 

15 In Figur 3 ist ein Ablaufdiagramm dargestellt, das einen 

Ablauf zur Analyse von Druckdaten darstellt. In einem ersten 
Schritt SI wird jeweils eine Gruppe von Druckdaten aus dem 
Druckdatenstrom 5 in einen vorgegebenen Bereich des, 
Controllers 6 eingelesen. Der Umfang der Gruppe kann 

20 individuell bestimmt werden, wobei eine Druckseite 

beispielsweise in 2, 5, lO.oder noch mehr Teilbereiche 
unterteilt sein kann. Die nachfolgende Analyse der Druckdaten 
erfolgt im sog. CI-Raum (Coded Information Raum) . Die Analyse 
erfolgt dabei so, dali die Auswirkungen der Datenumsetzung auf 

25 Pixel-basierter Basis, d.h. im sog. NCI-Raum (Non-Coded 
Information Raum) berucksichtigt werden. Dazu wird der 
Druckdatenstrom bzw. die Gruppen der Druckdaten nach gewissen 
Kategorien auf Formularindikatoren untersucht. Ein erster 
Formularindikator, der beispielsweise in Druckdatenstromen 

30 nach dem IPDS-Format haufig verwendet wird, sind sogenannte 
Overlay-Daten oder Overlay-Auf ruf e . Liegen solche Overlay- 
Daten oder ein Overlay-Auf ruf vor, so ist dies ein Hinweis 
darauf, dafi den Daten ein Formular zugrunde liegt. Die 
Overlay-Daten bzw. der Overlay-Auf ruf werden dann gemafi 

35 Schritt S7 weiterverarbeitet , der weiter unten'noch naher 
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beschrieben wird. Bei Overlays und Makros wird 
sinnvollerweise der jeweilige Aufruf ausgewertet, da ein 
definiertes Overlay oder Makro nicht notwendigerweise auch 
verwendet wird. Wurde ein Overlay also bereits einmal 
5 aufgerufen, so wird bei jedem spateren Aufruf dieses Overlays 
im Schritt S7 der Status „ja w ausgegeben. 

Die Untersuchung der Druckdaten kann relativ restriktiv 
erfolgen, d.h. Formularindikatoren nur dann als gegeben 
10 betrachtet werden, wenn sie relativ eindeutig darauf 
hinweisen, daft ein Formular vorliegt, d.h. daft die 
entsprechenden Daten innerhalb eines Druckjobs, der eine 
Vielzahl von Seiten enthalt, mehrmals vorkommen. 

15 Wurde im Schritt S2 kein Overlay f estgestellt , so wird im 
Schritt S3 untersucht, ob in der aktuellen Gruppe von 
Druckdaten Makro-Inf ormationen vorhanden sind, ggf . wird das 
jeweilige Makro hinsichtlich typischen Makro- 
Formularindikatoren im Schritt S13 uberpruft. In der 

20 Drucksprache PCL werden haufig wiederkehrende Aktionen 
regelmafiig in Makros abgelegt . Somit ist die 
Wahrscheinlichkeit, bei der Untersuchung von Makros auf 
konstante Daten mit Forme 1 char a kter, beispielsweise auf 
Felder mit grau hinterlegtem Hintergrund zu stofien. 

25 Gegebenenfalls wird im Schritt S6 eine Variable, die den 
Formelindikator reprasentiert, auf 1 (ja) gesetzt und die 
entsprechende Druckdatengruppe im Schritt S7 weiterbehandelt . 

Wie im Schritt S3 werden Daten, die kein Makro enthalten, 
30 auch im Schritt S4 hinsichtlich graphischen Objekten 

untersucht. Auch hier sind beispielsweise mit Graurastern 
gefailte Flachen im Schritt S14 erkennbar und wiederum mit 
dem Schritt S6 als Formularbestandteil zu kennzeichnen. 
Insbesondere werden gefiillte Rechtecke meist durch einfach zu 
35 erkennende Strukturen in entsprechenden Drucksprachen 
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beschrieben. Auch kleinere Bit-Maps in bestimmten Bereichen, 
z.B. ein Firmenlogo, auf den Druckseiten kc-nnen lohnenswerte 
Objekte sein,. die als Formularbestandteil gekennzeichnet 
werden konnen. 

5 

Ergibt auch Schritt S4 kein Formular-Ergebnis, so kann in 
einem Schritt S5 gepraft werden, ob in den aktuellen 
Druckdaten typische, haufig wiederkehrende Textbestandteile 
vorhanden sind. Bei dieser Priifung kann u.U. restriktiver 
10 vorgegangen werden, wenn die Textdaten zu einem hohen Grad 

individualisiert sind. Sind jedoch solche Textdaten eindeutig 
als Formularbestandteile in Schritt S15 ermittelt, so wird 
auch hier der Schritt S6 zum Schritt S7 fuhren. 

15 Textobjekte sollten ebenfalls nur in bestimmten Bereichen 
einer Seite, z.B. in der Fulizeile auf konstante Anteile 
untersucht werden. Dabei konnen beispielsweise auch 
Schrif tattribute untersucht werden. Beispielsweise deutet 
eine Schrif tgrolie < 10 pt darauf hin, daii eine Information 

20 eine Formularinf ormation ist. 

Wurdeim Schritt S6 ein Formularindikator entdeckt, so wird 
im Schritt S7 geprOft, ob diese (im NCI-Raum identische) 
Struktur bereits friiher aufgetreten ist. Wenn diese Bedingung 
25 nicht erfullt ist, so wird im Schritt S17 die aktuell 
aufgetretene Struktur in einem Strukturspeicher 40 
abgespeichert . Die Daten werden sodann im Rahmen des normalen 
Rasterprozesses im Schritt S9 in der Bit-Map 19a fur variable 
Daten im Rahmen des normalen Rasterprozesses S9 abgelegt. 

30 

Wird im Schritt S7 dagegen f estgestellt , dafc im Speicher 40 
bereits eine Struktur gespeichert ist, die den aktuellen 
Daten entspricht, so wird im Schritt S18 gepriift, ob die 
konstanten Daten bereits bei einer vorhergehenden Seite 
35 aufgerastert wurden und somit schon als Bitmap vorliegen. In 
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diesem Fall konnen im Schritt S12 direkt Referenzen zwischen 
den in den Bitmaps 20a, 20b, 20c gespeicherten konstanten 
Daten und den jeweils zugehorigen variablen Daten gebildet 
werden. Bei dieser Ref erenzbildung wird der Speicherort der 
5 Bitmaps im Festspeicher 20 und der Ort der Bitmap beziiglich 
der Druckseite (sog. xy-Position) in einer Ref erenztabelle 41 
festgehalten. Falls die konstanten Daten noch nicht 
aufgerastert sind, werden diese Daten in einem eigenen 
Rasterprozefi fur konstante Daten im Schritt S8 gerastert und 
10 in einer Bit-Map fur konstante Daten jeweils separat als Bit- 
Map 20a, 20b, 20c usw. abgespeichert . 

Nachdem die Schritte S18, S8, S9 und S12 abgeschlossen sind, 
wird im Schritt S10 iiberpriift, ob die aktuellen Daten ein 
15 Seitenende markieren; ; wenn nicht,- werden mit Schritt .Sl die 
nachsten Druckdaten eingelesen. 1st das Seitenende erreicht, 
so wird im Schritt Sll eine logische Statusvariable auf einen 
Wert „TRUE" gesetzt. 

20 Beim erstmaligen Auftreten einer Struktur mit 

Formularindikator wird diese Struktur lediglich im Coded- 
Format im Strukturspeicher 40 abgespeichert. Durch dieses 
Verfahren werden nur Strukturen, die wiederholt vorkommen, 
einer Sonderbehandlung unterworfen. Beim erstmaligen 

25 Auftreten einer solchen Struktur werden die entsprechenden 
Daten zunachst immer als variable Daten interpretiert . 

Bei bestimmten Ereignissen bzw. Kommandos innerhalb des 
Druckdatenstroms (z.B. beim Beginn eines neuen Druckjobs, bei 
30 einem Printer-Reset oder dergl.) werden die auf getretenen 
Strukturen im Strukturspeicher 40 geloscht. 

Beim wiederholten Auftreten einer im NCI-Raum identischen 
Struktur wird dieses im Schritt S12 in der Ref erenztabelle 41 
35 vermerkt. 
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In Figur 4 ist der Ablauf zum Archivieren der zuvor gemafi. 
Figur 3 verarbeiteten Druckdaten beschrieben. Im Schritt S20 
wird zunSchst gepriift, ob die Seitenende-Statusvariable (vgl. 
Schritt Sll), auf „TRUE XX gesetzt ist. 1st diese Bedingung 
5 erfullt, so werden die im Schritt S9 bzw. in Bit-Map. 19a 

gespeicherten, variablen Daten im Schritt S21 komprimiert und 
danach im Schritt S22 Verweise zu konstanten Daten. anhand der 
Referenztabelle 41 gebildet und abgelegt. 

10 Im Schritt S23 wird dann gepruft, ob zu.den in Schritt S22 
gebildeten Verweisen bereits konstante Daten im • 
Archivspeicher abgelegt sind. Wenn dies nicht der Fall ist, 
so werden die entsprechenden konstanten Daten aus den Bit- 
Maps 20a, 20b, 20c usw. unter Verwendung der Referenztabelle 

15 41 im Schritt S24 komprimiert und die komprimierten Daten im 
Schritt S25 im Archivspeicher abgelegt. 

Wird dagegen im Schritt S23 f estgestellt , daft im 
Archivspeicher bereits entsprechende Daten komprimiert 
20 abgelegt sind, so werden im Schritt S26 nur noch die 

aktuellen .variablen Daten komprimiert und im. Archivspeicher 
abgelegt. Danach wird im Schritt. S20 der nachste Datensa.tz 
behandelt, bis alle ankommenden Daten yerarbeitet sind.. 

25 Die variablen Daten werden in einem separaten Speicher 

aufgerastert und komprimiert. Beim Abspeichern der variablen 
Daten werden die Verweise, insbesondere diejenigen auf den 
XY-Of fset innerhalb, der Seite sowie diejenigen auf den 
Speicherort, der auf der Seite enthaltenen konstanten Daten 

30 hinzugefttgt. 

In Figur 5 ist der Prozefl zum Druckern der gemafi Figur 3 
verarbeiteten Daten dargestellt. Im Schritt S30 wird wiederum 
iiberprtift, ob alle Daten einer Seite abgearbeitet sind, d,h. 
35 ob in Schritt Sll von Figur 3 die Variable zum Seitenabschlufi 
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auf „TRUE* V gesetzt ist. 1st dies der Fall, so kann zum 
Drucken in Schritt S31 die in Speicher 19 gespeicherte Bit- 
Map 19a der variablen Daten einer Seite mit den 
entsprechenden Bit-Maps 20a, 20b, 20c der konstanten Daten 
5 der zugehorigen Seite anhand der Ref erenztabelle 41 

uberlagert werden. Dies kann beispielsweise durch eine 
logische „ODER"-Operation zwischen dem entsprechenden Bit-Map 
geschehen. Anschlie&end kann in Schritt S32 der Druckvorgang 
gestartet werden. 

10 

Ausgehend von dem in Figur 3 dargestellten Verfahren zur 
Untersuchung der Daten konnen die. Prozesse der Figuren 4 und 
5, d.h. Archivieren und Drucken, parallel erfolgen. 

15 Es wurden Ausf uhrungsbeispiele. der Erf indung beschrieben . 
Dabei ist klar, daii ohne weiteres Abwandlungen und 
Weiterentwicklungen der , Erf indung angegeben werden. konnen. . 
Beispielsweise kann. in einem Druck- und Archiviersystem 
vorgesehen sein, daft der Anwender bzw. das . Anwendungsprogramm 

20 bereits beim Erzeugen des Datenstroms immer wiederkehrende 
Daten ( Formulardaten) mit besonderen Kennzeichnungen 
versieht, (z.B. durch eine entsprechende Steuerinf ormation) 
und daft diese Kennzeichnungen im spateren Archivier- bzw. 
Druckvorgang entsprechend ausgewertet werden. Ahnlich wie bei 

25 der Overlay-Information kann damit eine sichere Entscheidung 
getroffen werden f dali bestimmte Daten Formulardaten sind. 

Es kann auch vorteilhaft sein, im Datenauf bereitungsprozefi 
(Fig. 3) nach dem Rastern der konstanten Daten im Schritt S8 
30 gleich die Schritte S24 und S25 durchzuf uhren und die 

konstanten Daten im Archivspeicher abzulegen. Hierzu mussen 
aber die Ablagearten der Daten friihzeitig bekannt sein. 
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Patent anspriiche 

1. Verfahren zur elektronischen Archivierung des von einem 
5 Computer (2) abgegebenen Datenstroms (5), der grafische 

und/oder Textinf ormationen enthalt, wobei der Datenstrom(S) 
von einem druckerspezif ischen Datenformat in ein .auf Pixel 
basierendes Datenformat (Bit Map) umgesetzt wird, dadurch 
gekennzeichnet, daft bei den auf Pixel basierenden Daten 
10 Formular-Daten (8) von variablen Daten (9) unterschieden 
werden und daft diese beiden Datenarten (8, 9) jeweils 
unterschiedlich verarbeitet werden. 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet , daft den 
15 variablen Daten (9) Verweise zu den Formulardaten (8) 

zugeordnet werden. 

3. Verfahren nach Anspruch 1 oder. 2, dadurch gekennzeichnet, 
daft innerhalb einer vorgegebenen Datengruppe (Job) ein 

20 Formular-Datensatz gleichartiger Formulardaten nu.r einmal 
abgespeichert wird, wahrend. die zugeordneten variablen 
Daten aller Datensatze der Datengruppe (Job) jeweils. alle 
gespeichert werden. 



25 4. . Verfahren nach einem der Anspriiche 1 bis 3, dadurch . 
gekennzeichnet, daft eine Unterscheidung zwischen 
Formulardaten (8) und variablen Daten (9) im 
. druckerspezif ischen Datenformat erfolgt. 

30 5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daft im 
Datenstrom (5) Formularindikatoren zur Erkennung von 
Formular-Daten (8) gesucht werden. 



6. Verfahren nach Anspruch 4 oder 5, dadurch gekennzeichnet, 
daft die Daten des Datenstroms (5) gruppenweise zunachst auf 
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Formularindikatoren untersucht werden und nur bei 
wiederholtem Auftreten von Formula rda ten (8) die Zuordnung 
zwischen den variablen Daten (9) und den Formulardaten (8) 
erf olgt . 

5 

7. Verfahren nach Anspruch 6, dadurch gekennzeichnet , daJi als 
Formularindikatoren Overlay-Inf ormationen, besondere 
Steuerinformationen, Makro-Inf ormationen, graphische 
Informationen, vorgegebene Textbausteine und/oder 

10 vorgegebene Textattribute verwendet werden. 

8. Verfahren nach einem der Anspriiche 4 bis 7, dadurch 
gekennzeichnet, daft ein Formular-Datensatz nach dem ersten 
Auftreten innerhalb der vorgegebenen Datengruppe (Job) des 

15 Druckdatenstroms (5) abgespeichert wird und erst nach 
wiederholtem, insbesondere zweitem Auftreten als 
Formulardatensatz markiert, in eine Formular-Bit-Map (20a, 
20b, 20c) umgesetzt und dem zugehorigen variablen- Datensatz 
(9) zugeordnet wird. 

20 

9. Verfahren nach einem der vorhergehenden Anspriiche, dadurch 
gekennzeichnet, daft innerhalb eines Arbeit sablaufes 
wahlweise entweder gedruckt oder archiviert, oder 
gleichzeitig gedruckt und archiviert wird. 

25 

10. Verfahren nach einem der vorhergehenden Anspriiche, 
dadurch gekennzeichnet, daJi die Formulardaten im 
Archivspeicher (3) nicht abgespeichert werden. 

30 11. Verfahren nach einem der vorhergehenden Anspriiche, dadurch 
gekennzeichnet, dafi-das urspriingliche Pixelbild aus den 
Formular-Daten (8) und den variablen Daten (9) 
rekonstruiert wird. 
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12. Verfahren nach einem der vorhergehenden Anspriiche, dadurch 
gekennzeichnet, daS unter Verwendung der Verweise eine 
Oberlagerung der Formula r- Da ten (8) und der variablen 
Daten (9) erfolgt. 

5 

13. Verfahren nach einem der vorhergehenden Anspriiche, dadurch 
gekennzeichnet, dafi ein Index-Datensatz erzeugt wird. 

14. Verfahren nach einem der vorhergehenden Anspriiche, dadurch 
gekennzeichnet, dafi der Index-Datensatz einen Verweis auf 
die variablen Daten (9), insbesondere auf die Formular- 
Daten (8), enthalt. 

15. Gerat zur elektronischen Archivierung des von einem 
Computer abgegebenen Datenstroms (5), der grafische 
und/oder Textinf ormationen enthalt, wobei der : 
Druckdatenstrom (5) von einem druckerspezif ischen 
Datenformat in ein auf Pixel basierendes Datenformat (Bit 
Map) umgesetzt wird, dadurch gekennzeichnet, dafi eine 
Archivierungs-Schnittstelle (1) vorgesehen ist, die im auf 
Pixel basierenden Datenformat Formular- Daten (8) und 
variable Daten (9) unterschiedlich verarbeitet. 

16. Gerat nach Anspruch 15, gekennzeichnet durch einen 
Drucker-Controller (6), der iiber eine Schnittstelle 
variable Daten (9), Formular-Daten £8) und Index-Daten 
(10) an einen Weiterverarbeitungscomputer . (PC) ubergibt. 

17. Gerat nach Anspruch 16, bei dem die Verarbeitungs- 
einheiten des Weiterverarbeitungscomputers (PC) in den 
Drucker-Controller integriert sind. 



18.Gerat nach Anspruch 15 bis 17, dadurch gekennzeichnet, 
dafi in der Archivierungs-Schnittstelle (1) Formular-Daten 
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(8) und variablen Daten (9) unterschieden werden. 

19.Gerat nach einem der Anspruche 15 bis 18 dadurch 
gekennzeichnet, dafi zur Unterscheidung zwischen 
Formulardaten (8) und variablen Daten (9) der Datenstrom 
(5) im druckerspezif ischen Datenformat untersucht wird. 
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The invention relates to a method and device for electronic archiving of a data flow (2) which contains graphic and/or text information 
and is outputted by a computer (2). The print data flow (5) is convened from a printer-specific data format into a pixel based data format 
(Bit map). Form data (8) is distinguished from variable data (9) in said pixel based data and both categories of data (8,9) are processed 
differently. y 
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(57) Zusammenfassung 

Die Erfindung betrifft ein Verfahren und ein Gerat zur elektronischen Archiviemng des von einem Computer (2) abgegebenen 
Datenstroms (5), der grafische und/oder Textinformationen en thai t. Der Druckdatenstrom (5) wird von einem druckerspezifischen 
Datenformat in ein auf Pixel basierendes Datenformat (Bit Map) umgesetzt. Bei den auf Pixel basierenden Daten werden Formular-Daten 
(8) von variablen Daten (9) unterschieden und diese beiden Datenarten (8, 9) jeweils unterschiedlich verarbeitet. 
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